Les méthodes discutées dans ce chapitre généralisent le test d’égalité de deux moyennes : on y test l’égalité de plus de deux moyennes. Typiquement, lorsqu’on teste l’hypothèse µ1 = µ2, c’est parce que deux groupes de sujets sont soumis à deux traitements différents et la différence µ1 - µ2 est une mesure de l’effet des traitements l’un par rapport à l’autre.
Or un bon nombre d’expériences scientifiques ne se limitent pas à une comparaison de deux traitements. On peut, par exemple vouloir comparer l’effet de k fertilisants chimiques, k > 2, sur la croissance d’un type de maïs. On applique les fertilisants sur k différents terrains, puis on estime les récoltes moyennes µ1, µ2, … , µk.
On sera évidemment intéressés à tester plusieurs hypothèses concernant ces moyennes, mais avant tout, on testera l’hypothèse qu’elles sont toutes égales, soit
Ho : µ1 = µ2 = … = µk, l’hypothèse qu’aucun de ces fertilisants n’est utile.
Ce type d’analyse est appelé analyse de variance.
On peut interpréter l’analyse de variance comme la version qualitative d’une régression : la variable endogène est la récolte Y, alors que la variable exogène est X = « type de fertilisant ». Les méthodes du dernier chapitre ne s’appliquent pas du fait que X est qualitative, mais la question est la même : est-ce qu’il y a un lien entre le type de fertilisant et la récolte?